iT邦幫忙

2022 iThome 鐵人賽

DAY 11
0
AI & Data

上課了!李宏毅老師 機器學習 (2021)系列 第 11

卷積神經網路 (Convolutional Neural Networks, CNN)

  • 分享至 

  • xImage
  •  

影像辨識的輸入為一張圖片,輸出可以是一個向量,向量的長度就是可以辨識的種類數。而輸入的圖片是一個三維的 tensor。但如果將三維的 tensor 拉平來餵入模型,這個模型就會有爆炸多的參數。模型的參數越多,雖然可以增加模型的彈性,但也會增加模型 overfitting 的問題。

但其實可以不用一個像素一個像素來看,而是找出特徵來看就好。譬如說,辨識一隻鳥可以看有沒有鳥的眼睛、有沒有鳥的嘴就好了,其他的地方就不用看了。這邊每個 neurons 則是負責看一個 receptive field,而 receptive field 的範圍或做法可以根據需要來改變設計。而最經典的 receptive field 會看全部的 channels。

接著介紹幾個名詞

  1. kernel size (3x3)
  2. stride (2) 通常不會設太大
  3. padding 超出範圍之外補植的方法

此外 CNN 還有個重要的特性,就是不同的 receptive field 共享參數。也就是同一個 neuron 來偵測相同特徵。

fully connected layer > receptive field > parameter sharing (Convolutional Layer)


上一篇
卷積神經網路 (Convolutional Neural Networks, CNN) 之一
下一篇
自注意力機制 (Self-attention) 之一
系列文
上課了!李宏毅老師 機器學習 (2021)16
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言